Skyline Ranking à la IR

نویسندگان

  • George Valkanas
  • Apostolos N. Papadopoulos
  • Dimitrios Gunopulos
چکیده

Skyline queries have emerged as an expressive and informative tool, with minimal user input and thus, they have gained widespread attention. However, previous research works tackle the problem from an efficiency standpoint, i.e., returning the skyline as fast as possible, leaving it to the user to manually inspect the entire skyline result. Clearly, this is impractical, even with a few dozen points. The techniques addressing this issue are computationally expensive, mapping to NP-Hard problems or having exponential complexity O(2) with respect to data dimensionality d. Moreover, the result is a set, lacking any quality-based ranking. In this paper, we propose a novel IR-style ranking mechanism for skyline points, based on the renowned tf-idf weighting scheme. We present efficient algorithms to compute the quality of a skyline point according to our technique, and induce a total ordering of the skyline set. Finally, we empirically evaluate the efficiency of our method with real-life and synthetic data sets.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Relaxation des Requêtes Skyline : Une Approche Centrée Utilisateur

Résumé. Les requêtes skyline constituent un outil puissant pour l’analyse de données multidimensionnelles et la décision multicritère. En pratique, le calcul du skyline peut conduire à deux scénarios : soit (i) un nombre important d’objets sont retournés, soit (ii) un nombre réduit d’objets sont retournés, ce qui peut être insuffisant pour la prise de décisions. Dans cet article, nous abordons ...

متن کامل

Requêtes skyline en présence d'exceptions

Résumé. Dans cet article, nous nous intéressons à la recherche des points les plus intéressants au sens de l’ordre de Pareto, i.e., à l’évaluation de requêtes « skyline » , dans des jeux de données présentant des anomalies. Il n’est pas rare que les données, de petites annonces par exemple, soient peuplées d’erreurs ou d’exceptions qui peuvent perturber la recherche des meilleurs points car cel...

متن کامل

Requêtes Skyline avec prise en compte des préférences utilisateurs pour des données volumineuses

Résumé. Appréhender, parcourir des données ou des connaissances reste une tâche difficile en particulier lorsque les utilisateurs sont confrontés à de gros volumes de données. De nombreux travaux se sont intéressés à extraire des points "skylines" comme outil de restitution. La prise en compte des préférences a retenu l’attention des travaux les plus récents mais les solutions existantes resten...

متن کامل

Link-based Ranking of Skyline Result Sets

Skyline query processing has received considerable attention in the recent past. Mainly, the skyline query is used to find a set of non dominated data points in a multi-dimensional dataset. One of the major drawbacks of the skyline operator is the high cardinality of the result set. Providing the most interesting points of the skyline set (top-k) inherently involves the ranking of the skyline p...

متن کامل

Treillis des Concepts Skylines : analyse multidimensionnelle des Skylines fondée sur les ensembles en accords

Résumé. Le concept de SKYLINE a été introduit pour mettre en évidence les objets « les meilleurs » selon différents critères. Une généralisation multidimensionnelle du SKYLINE a été proposée à travers le SKYCUBE qui réunit tous les SKYLINES possibles selon toutes les combinaisons de critères et permet d’analyser les liens entre objets SKYLINES. Comme le data cube, le SKYCUBE s’avère extrêmement...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014